华为、阿里押注“超节点”:不卷单卡性能 追求“系统效率”才是国产AI正解?
《科创板日报》10月4日讯人工智能正以史无前例的速度重塑各行业,这场变革背后离不开海量算力的支持。当AI模型参数从亿级跃升至万亿级,“超节点”开始逐渐取代单机与传统集群,成为新一代的“算力法宝”。
《科创板日报》10月4日讯人工智能正以史无前例的速度重塑各行业,这场变革背后离不开海量算力的支持。当AI模型参数从亿级跃升至万亿级,“超节点”开始逐渐取代单机与传统集群,成为新一代的“算力法宝”。
一家叫RapidFire AI的初创公司,发布了一个开源的大语言模型微调引擎,能让你的单个GPU同时并行跑上多个任务,把实验吞吐量直接干到了惊人的20倍。
“风华1号”,2021年问世,是中国第一款能用于数据中心的4K级别智能渲染GPU。单精度浮点算力是5TFLOPS,用两颗“风华1号”芯片做出来的显卡,性能可以对标英伟达的T4。显存方面,它用了当时很先进的GDDR6/GDDR6X技术,最大容量16GB。
昨天刷到珠海香山会议中心的消息时,我手里的咖啡差点没拿稳——不是因为现场人多热闹,而是芯动科技亮出的“风华3号”,把我之前对国产GPU的不少顾虑都给打消了。
今天,百川智能正式发布开源医疗增强大模型 Baichuan-M2。就在五天前,OpenAI 刚刚开源了两款主打低部署成本和顶尖医疗能力的大模型gpt-oss-120b 和gpt-oss-20b。
长视频理解是多模态大模型关键能力之一。尽管OpenAI GPT-4o、Google Gemini等私有模型已在该领域取得显著进展,当前的开源模型在效果、计算开销和运行效率等方面仍存在明显短板。
智源研究院发布开源模型Video-XL-2,显著提升长视频理解能力。该模型在效果、处理长度与速度上全面优化,支持单卡处理万帧视频,编码2048帧仅需12秒。